如何選擇梯度下降法中的學習速率α(Gradient Descent Learning Rate Alpha)
梯度下降算法的任務是尋找參數θ,使之能夠最小化損失函數。 那么梯度下降法中的學習速率α應該如何選擇呢?通常我們畫出損失函數隨迭代次數增加而變化的曲線。 可能會得到如下的一條曲線,x軸表 ...
梯度下降算法的任務是尋找參數θ,使之能夠最小化損失函數。 那么梯度下降法中的學習速率α應該如何選擇呢?通常我們畫出損失函數隨迭代次數增加而變化的曲線。 可能會得到如下的一條曲線,x軸表 ...